LInux 系统优化 优化的方法和思路

1 影响 Linux 性能的各种因素

1.1 系统硬件资源

(1)CPU
如何判断多核 CPU 与超线程
消耗 CPU 的业务:动态 web 服务、mail 服务
(2)内存

1.2 操作系统相关资源

(1)系统安装优化
磁盘分区、RAID 设置、swap 设置
(2)内核参数优化
ulimit -n(最大打开文件数)
ulimit -u(最大用户数)
(3)文件系统优化

建议:
读操作频繁,同时小文件众多的应用:首选 ext4 文件系统,接下来依次是 xfs、ext3
写操作频繁的应用,首选是 xfs,接下来依次是 ext4 和 ext3
对性能要求不高、数据安全要求高的业务,ext3 是比较好的选择。
3、程序问题
此类问题需要开发人员查看代码,介入处理。但作为运维人员需要给出程序问题的有力证据。

2 Linux 性能优化工具

1、CPU 性能评估工具
(1)vmstat(系统默认自带)
利用 vmstat 命令可以对操作系统的内存信息、进程状态、CPU活劢等进行监视。
常用方式:vmstat 2 3
表示每 3 秒更新一次输出信息,统计 5 次后停止输出。
下面是 vmstat 命令在某个系统的输出结果:
图片

对上面每项的输出解释如下:

一般情况下, si、 so 的值都为 0,如果 si、 so 的值长期不为 0,则表示系统内存不足。需要增加系统内存。

这里我们设置的 bi+bo 参考值为 1000,如果超过 1000,而且 wa值较大,则表示系统磁盘 IO 有问题,应该考虑提高磁盘的读写性能。

综上所述,在对 CPU 的评估中,需要重点注意的是procs 项 r 列的值和 CPU 项中 us、sy和 id 列的值。

(2)iostat(需要安装 sysstat 工具包)

iostat 是 I/O statistics(输入/输出统计)的缩写,主要的功能是对系统的磁盘 I/O 操作进行监视。

常用方式:iostat -c 3 5

其中,-c 表示显示CPU 的使用情况,-d:显示磁盘的使用情况。

(3)uptime 命令

uptime 是监控系统性能最常用的一个命令,主要用来统计系统当前的运行状况,输出的信息依次为:系统现在的时间、系统从上次开机到现在运行了多长时间、系统目前有多少登陆用户、系统在一分钟内、五分钟内、十五分钟内的平均负载。

2、内存性能评估

(1)free 命令

free 命令是监控 linux 内存使用状况最常用的指令

常见用法:free –m

看下面的一个输出:

图片

“free –m”表示以 M为单位查看内存使用情况,在这个输出中,我们重点关注的应该是 free 列与 cached 列的输出值,由输出可知,此系统共 8G 内存,系统空闲内存还有925M,其中,Buffer Cache 占用了 243M,Page Cache 占用了 6299M,由此可知系统缓存了很多的文件和目录,而对于应用程序来说,可以使用的内存还有 7468M,当然这个 7468M 包含了 Buffer Cache 和 Page Cache 的值。在 swap 项可以看出,交换分区还未使用。所以从应用的角度来说,此系统内存资源还非常充足。

一般有这样一个经验公式:应用程序可用内存/系统物理内存>70%时,表示系统内存资源非常充足,不影响系统性能,应用程序可用内存/系统物理内存<20%时,表示系统内存资源紧缺,需要增加系统内存,20%<应用程序可用内存/系统物理内存<70%时,表示系统内存资源基本能满足应用需求,暂时不影响系统性能。

(2)sar/pidstat

此两个命令主要用于监控全部或指定进程占用系统资源的情况,如 CPU,内存、设备IO。

三个公用参数:-u(获取 CPU 状态) 、-r(获取内存状态) 、-d(获取磁盘)

常用组合:

sar -u 3 获取 cpu 3 秒内的状态

pidstat -r –p 1 3 获取内存 3 秒内的状态

看看以上两个命令的差别?

请看下面的一个输出:

图片

其中:

Kbmemfree 表示空闲物理内存大小,kbmemused 表示已使用的物理内存空间大小,%memused 表示已使用内存占总内存大小的百分比,kbbuffers 和 kbcached 分别表示Buffer Cache 和 Page Cache 的大小,kbcommit 和%commit 分别表示应用程序当前使用的内存大小和使用百分比。

可以看出 sar 的输出其实与 free的输出完全对应,不过 sar 更加人性化,不但给出了内存使用量,还给出了内存使用的百分比以及统计的平均值。从%commit 项可知,此系统目前内存资源充足。

3 磁盘性能评估

(1)iostat –d 组合

iostat –d 2 3

通过“iostat –d”命令组合也可以查看系统磁盘的使用状况,请看如下输出:

图片

对上面每项的输出解释如下:

(2)pidstat -d -p 31887 3

(3)sar -d 2 3

通过“sar –d”组合,可以对系统的磁盘 IO 做一个基本的统计,请看下面的一个输出:

图片

对上面每项的输出解释如下:

Linux 中 I/O 请求系统与现实生活中超市购物排队系统有很多类似的地方,通过对超市购物排队系统的理解,可以很快掌握 linux 中 I/O 运行机制。比如:

对于磁盘 IO 性能,一般有如下评判标准:

正常情况下 svctm 应该是小于 await 值的,而 svctm 的大小和磁盘性能有关,CPU、内存的负荷也会对 svctm值造成影响,过多的请求也会间接的导致 svctm值的增加。

await 值的大小一般取决于 svctm 的值和 I/O 队列长度以及 I/O 请求模式,如果 svctm的值与 await 很接近,表示几乎没有 I/O 等待,磁盘性能很好,如果 await 的值远高于 svctm的值,则表示 I/O 队列等待太长,系统上运行的应用程序将变慢,此时可以通过更换更快的硬盘来解决问题。

%util 项的值也是衡量磁盘 I/O 的一个重要指标,如果%util 接近 100%,表示磁盘产生的 I/O 请求太多,I/O 系统已经满负荷的在工作,该磁盘可能存在瓶颈。长期下去,势必影响系统的性能,可以通过优化程序或者通过更换更高、更快的磁盘来解决此问题。

4 网络性能评估

(1)ping 命令

请看下面的一个输出:

图片

在这个输出中,time值显示了两台主机之间的网络延时情况,如果此值很大,则表示网络的延时很大,单位为毫秒。在这个输出的最后,是对上面输出信息的一个总结,packet loss 表示网络的丢包率,此值越小,表示网络的质量越高。

(2)netstat 命令

netstat –i (查看路由情况)

netstat –r(查看网络接口状态)

(3)mtr/traceroute 命令

跟踪网络路由状态,推荐使用 mtr,动态跟踪网络路由,用于排除网络问题非常方便。

5 系统性能分析标准

图片